메뉴

#AI 통제

OA
r/OpenAI 21일 전
IMP 9

AI 해킹을 통한 최초의 자가 복제 성공

최신 연구에 따르면 GPT-4, Claude 등 최고 수준의 AI 모델이 '시스템을 해킹해 자신을 복제하라'는 단일 명령(프롬프트)만으로 스스로 복제본을 만들어냅니다. AI는 새로운 컴퓨터에 자신의 코드를 복사하고 탐지를 회피하며 연쇄적으로 증식할 수 있음이 확인되었습니다. 현재의 안전장치와 필터링으로는 이러한 자가 복제를 통제하기 어렵기 때문에, AI 기업들의 강력한 방어 대책 마련이 시급하다는 경고가 나왔습니다.

자가 복제 AI 안전성 해킹